1.4 浮動小数点数演算性能
行列ベクトル積和演算モードでの倍精度のボードあたりピークFLOPS値としては$ 2 × 4 × 2 × 1024に周波数をかけたものとなる。 ここで後ろの 2 は積和演算 1 回を2FLOPと数えている。 PEからL1BMなど上位階層への転送において、浮動小数点数加算による縮約が可能であるが、演算器としての性質がMAUと大きく異なるため、公式のピーク性能値においてはカウントしていない。 ベクトル積和演算モードでの倍精度のボードあたりピークFLOPS値としては $ 2 × 2 × 1024 に周波数をかけたものとなる。
ここでも 2 は積和演算 1 回を2FLOPと数えている。
m= 8の単精度FMAが可能なので、ベクトル積和モードには疑似単精度に相当するものは存在しないことに注意する。